اتصل بنا
كيفية الالتحاق
الجامعة الأردنية
الوظائف والإيفاد
English
الكلية
عن الكلية
استراتيجية الكلية
الهيكل التنظيمي
كلمة العميد
العمداء السابقون
مكتب العميد
مجلس الكلية
اساتذه الشرف
الاساتذه الفخرين
الهيئة التدريسية
الهيئة التدريسية السابقة
الموظفون الاداريون
حقائق وأرقام
إنجازات الكلية
الأقسام
الهندسة المدنية
هندسة العمارة
الهندسة الكهربائية
الهندسة الميكانيكية
الهندسة الكيميائية
الهندسة الصناعية
هندسة الحاسوب
هندسة الميكاترونيكس
البرامج
البكالوريوس
الدراسات العليا
الاعتماد
نبذة
مكتب شؤون الجودة والاعتماد
نائب/مساعد العميد لشؤون الجودة والاعتماد
المكتب
التوثيق والنماذج
ABET البرامج المعتمدة
المكاتب الادارية
مكتب شؤون الطلبة
مساعد العميد لشؤون الطلبة
المكتب
النماذج
مكتب تدريب الطلبة
مرافق الكلية
مرافق تعليمية وبحثية
مرافق رياضية
مرافق ترفيهية اجتماعية
مرافق أخرى
الكلية
عن الكلية
استراتيجية الكلية
الهيكل التنظيمي
كلمة العميد
العمداء السابقون
مكتب العميد
مجلس الكلية
اساتذه الشرف
الاساتذه الفخرين
الهيئة التدريسية
الهيئة التدريسية السابقة
الموظفون الاداريون
حقائق وأرقام
إنجازات الكلية
الأقسام
الهندسة المدنية
هندسة العمارة
الهندسة الكهربائية
الهندسة الميكانيكية
الهندسة الكيميائية
الهندسة الصناعية
هندسة الحاسوب
هندسة الميكاترونيكس
البرامج
البكالوريوس
الدراسات العليا
الاعتماد
نبذة
مكتب شؤون الجودة والاعتماد
نائب/مساعد العميد لشؤون الجودة والاعتماد
المكتب
التوثيق والنماذج
ABET البرامج المعتمدة
المكاتب الادارية
مكتب شؤون الطلبة
مساعد العميد لشؤون الطلبة
المكتب
النماذج
مكتب تدريب الطلبة
مرافق الكلية
مرافق تعليمية وبحثية
مرافق رياضية
مرافق ترفيهية اجتماعية
مرافق أخرى
الإنجازات
اتصل بنا
الجامعة الأردنية
English
هندسة الحاسوب
الرئيسية
الاستراتيجية
الهيئة التدريسية
الهيئة الإدارية
البرامج
الخطط الدراسية
المواد الدراسية
البحث العلمي
المختبرات
نماذج
( 0907755)التعلم المعزز
وصف المادة :
هذه المادة تعنى بالتنبؤ والتحكم باستخدام التعلم المعزز، بما في ذلك جوانب التعلم المعزز العميق، أي تطبيق التقريب الوظيفي القائم على الشبكات العصبية لمشاكل التعلم المعزز. في هذه المادة يتم تغطية المحتوى النظري والتطبيقات المتعلقة بالمواضيع الآتية: عمليات اتخاذ القرار الماركوفية. تقريب دالة القيمة. طرق التدرج في سياسة تعلم الآلة، خوارزميات الممثل الناقد. تكامل التعلم والتخطيط. مفاضلات الاستكشاف مقابل الاستغلال. يتم تدريس هذه المادة على أسلوب التعلم النشط لتعزيز تفاعل الطلبة بالمادة. تستضيف المادة خبراء من القطاع الصناعي للتحدث عن التطبيقات العملية في هذا المجال. تتضمن هذه المادة مهام عملية ومشروع فصلي تطبيقي.
المتطلب السابق :
0907726
الساعات المعتمدة :
3
القسم :
هندسة الحاسوب
البرنامج :
ماجستير الذكاء الاصطناعي والربوتات
مستوى المادة :
الماجستير
خطة المادة :
CPE_0907755_Reinforcement Learning_Summer_2023.pdf